年輕的時候喜歡附庸風雅,讀了很多哲學書。高中時本來也打算將來讀文學或哲學的,一直到讀了史蒂芬.霍金的「時間簡史」,看來看去一直讀不懂,意識到「科學」,或者至少物理學這一門,我是需要人帶入門的,才決定轉念自然組,理想科系也由哲學換成心理學。
雖然換了組別,亂讀書的習慣還是留了下來,大學時也跟幾個「偽文青」朋友按圖索驥的照著哲學史慢慢的讀著,討論著。
讀了這些東西,和後來的專業其實沒什麼直接的關係,但是不能否認的是,往後在討論比較抽象層次的議題時,這些知識在我腦海裡形成的地圖,可以讓我比較快定出自己所在的位置,跟應該前進的方向。
但這倒也不是全無壞處的。人如果真的思路一路跟著當代哲學走,從結構主義的各家觀點,走到解構主義或是後現代,那基本上就很難再回頭了,至少對我自己來說是這樣的:太習慣去解構人家提出的每個觀點,一方面會人緣不好,另外一方面也就不容易再去堅決的相信些什麼。
這也是後來選擇工程研發作為職業, "it is not what I claimed, but what I did, that defines me" 成為自我介紹,部落格標題還用了 esse ("存在"的拉丁文,不是德文的"吃")的主要原因。套用現在流行的用語,這也就是 "be data-driven"了。
這個冗長的開場白,到目前為止好像也只稍稍擦到題目的邊,無非是為了增加一點寫這篇文章的正當性。這裡不打算細說各家哲學理論,哲學史上重要的著作很多,即使只算我讀過的,也是很難一語道盡,更不用說相關的名家論述汗牛充棟,也輪不到我多嘴。
跟資料分析比較有關係的,應該是當代哲學跟科學哲學的部分,芬蘭一位教授 Jyväskylän yliopiston Koppa 的 Philosophy of Science 網站上倒是有不錯的摘要,去圖上點一點,可以快速的看到各派論點的摘要。
各家哲學的觀點,主要在詮釋「事實」(facts,實際發生的,可以被觀察到的事件)與「真實」(reality,真相,表象背後的深層真理)之間的關係。科學的各學門絕大部分都是以「事實」作為基礎的,所以除了走純理論的科學家之外,data-driven 算是共同的基礎,但是「資料驅動」可以驅動到什麼程度,就可以看出各個學派的差異了。
圖中靠外邊的那些理論,大多是認為「真實並不存在」、「不想討論真實的存在」或「真實即使存在,也難以用任何客觀的方式達到」的,所以 data-driven 可以比較不受限制;比較核心那些的觀點,就比較依賴人主觀形成理論來指引資料的詮釋。
在實務上,資料驅動的方法真的可以形成「知識」嗎?就筆者本身知道的,目前大概只有 Google 訓練電腦自己形成「貓」的概念,算是接近成功的例子,不過動用 16,000 個處理器去分析一千萬幅影像,不見得是一般人可以負擔的資源。其他大部分的資料分析應用,還是先由理論架構作為導引,比較能產生應用的價值。
目前只談到「資料分析」的整體,其實不同的分析方法背後也有其哲學意涵,那就以後再說吧。
2 則留言:
希望能看到後續文章 :)
當年雖然沒有發「如果再談這個就剁手指」之類的毒誓,不過我的文青年代已經遠去了...
張貼留言